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基于 自 适应 门 控 图 神经 网 络 的 交通 流 预测 


王 杨 , 郑 HX] Be Ee F 
(西南 石油 大 学 计算 机 科学 学 院 , 成 都 610500) 


摘 要 : 交通 流 预测 是 智能 交通 系统 中 的 重要 组 成 部 分 ， 由 于 交通 数据 的 复杂 性 ， 长 期 而 又 准确 的 交通 流 预测 一 直 
是 时 间 序 列 预测 中 最 具 挑 战 性 的 任务 之 一 。 近 年 来 ， 研 究 人 员 将 基于 图 神经 网 络 的 时 空 图 建 模 方法 应 用 于 交通 流 预 
测 任务 ， 并 取得 了 良好 的 预测 性 能 。 然 而 ， 现 有 的 图 建 模 方 法 仅 通过 预定 义 的 邻接 结构 反映 道路 网 络 中 的 空间 依赖 
关系 ,忽略 了 各 节点 之 间 的 序列 关联 关系 对 预测 的 重要 性 。 针 对 这 一 局 限 性 ,提出 了 一 种 自 适应 门 控 图 神经 网 络 (Ada- 
GGNN)， 其 核心 为 通过 空间 传递 模块 同时 捕获 道路 网 络 的 空间 结构 及 自 适 应 的 时 序 相 关 性 ， 并 通过 门 控 机 制 学 习 节 
点 上 的 时 间 序 列 特征 。 在 两 个 真实 交通 网 络 数据 集 PeMSD7 和 Los-loop 上 的 实验 结果 证 明了 该 模型 具有 更 优越 的 性 能 。 
关键 词 : 交通 流 预测 ; HEA; 自 适应 门 控 图 神经 网 络 ; 时 序 相 关 性 
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Traffic flow prediction based on adaptive gated graph neural network 


Wang Yang, Zheng Jin’, Liu Ying, Li Ping 
(College of Computer Science, Southwest Petroleum University, Chengdu 610500, China) 


Abstract: Traffic flow prediction is an important part of intelligent transportation system. Due to the complexity of traffic 
data, long-term and accurate traffic flow prediction has always been one of the most challenging tasks in time series forecasting. 
In recent years, researchers have applied spatial-temporal graph modeling methods based on graph neural networks to traffic 
flow prediction tasks which achieved good prediction performance. However, existing graph modeling methods only reflect 
the spatial dependence in road networks through predefined adjacency structures, ignoring the importance of time-series 
correlation between nodes for prediction. Aiming at this limitation, this paper proposed an Adaptive Gated Graph Neural 
Network (Ada-GGNN) , the core of which was to simultaneously capture the spatial structure of the road network and adaptive 
time series correlation through the spatial passing module, and learned time-series features on nodes through the gating 
mechanism. The experimental results on two real-world traffic network datasets PEMSD7 and Los-loop show that the model 
has better performance. 

Key words: traffic flow prediction; spatial-temporal graph; adaptive gated graph neural networks; time series correlation 


经 网 络 的 方法 相 较 于 传统 方法 具有 更 优异 的 结果 ， 但 是 该 方 
法 仍 没 有 考虑 交通 路 网 的 空间 结构 。Shi 等 人 的 设计 了 
智能 交通 系统 是 智慧 城市 发 展 不 可 或 缺 的 组 成 部 分 ， 而 ConvLSTM 模型 用 于 降雨 预测 ， 它 将 卷 积 神经 网 络 (CNN) 和 
一 准确 实时 的 交通 流 预 测 作为 智能 交通 系统 的 基础 和 重要 研究 ”循环 神经 网 络 RNN) 进 行 结合 ， 分 别 对 空间 和 时 间 相 关 性 进 
方向 ， 它 是 减少 交通 事故 、 缓 解 交通 拥堵 和 提高 交通 运输 效 ， 行 建 模 。 之 后 , Zhang 等 人 [将 交通 路 网 转换 为 规则 的 网 格 ， 

率 的 有 效 解决 方案 。 在 实际 生活 中 ， 交 通 流通 常 由 道路 上 的 。” 然后 采用 CNN 提取 空间 特征 。 虽 然 这 些 模型 可 以 提取 数据 
传感器 记录 ， 如 流量 、 车 速 、 道 路 占用 率 等 。 交 通 流 预测 由 ”的 时 空 特征 ， 但 交通 道路 本 质 上 是 不 规则 的 ， 将 交通 数据 视 
在 根据 道路 网 络 中 的 历史 交通 数据 (如 传感器 记录 ) 预 测 未 来 ”为 规则 的 2 维 或 3 维 网 格 数据 会 导致 空间 拓扑 信息 的 丢失 。 

一 段 时 间 的 交通 数据 。 传 统 的 交通 流 预测 模型 主要 是 基于 统 随后 ， 研 究 人 员 引 入 了 图 神经 网 络 (GNN) 来 对 时 空 网 络 
计 或 机 器 学 习 的 方法 ， 如 历史 平均 模型 (HA)I、 自 回归 整合 ”数据 进行 建 模 ， 并 在 交通 流 预 测 任务 上 取得 了 巨大 进步 。Li 
移动 平均 模型 (ARIMA)P、 向 量 自 回归 (VAR)BI、k- 最 近邻 模 等 人 四 提出 了 DCRNN 模型 ， 它 将 交通 网 络 建 模 为 有 向 图 ， 

型 KNN) 中 等, 以 上 方法 在 实际 应 用 中 往往 预测 效果 不 佳 , 它 ”采用 双向 随机 游 走 捕获 道路 之 间 的 空间 依赖 性 , 并 使 用 RNN 


T 


3 


们 依赖 于 数据 的 平稳 性 假设 。 然 而 交通 状况 是 复杂 的 ， 受 各 获 时 间 相关 性 ， 该 方法 同时 处 理 了 时 间 和 空间 信息 ， 有 共有 
种 环境 因素 影响 ， 表 现 出 随机 性 、 周 期 性 、 趋 势 性 和 时 空 性 ”更 准确 的 预测 结果 .。 此 后 , 研究 人 员 对 GNN 与 CNN 或 RNN 
等 特点 。 其 次 , 这 些 方 法 需要 经 过 复杂 的 特征 工程 进行 建 模 ， 结合 起 来 的 这 种 研究 范式 进行 了 深入 挖掘 , 例如 : 文献 [9~11] 
并 且 只 考虑 了 序列 的 时 间 信 息 ， 而 忽略 了 空间 信息 对 于 交通 。 ”都 采用 了 ONN 来 获取 拓扑 结构 中 的 空间 依赖 性 ， 采 用 一 维 
流 预 测 的 重要 性 。 卷 积 或 RNN 来 获取 动态 的 时 间 依 赖 性 。 

近年 来 ， 深 度 学 习 因 其 强大 的 特征 表达 能 力 和 非 线性 拟 尽管 这 些 基于 图 神经 网 络 的 方法 在 交通 流 预测 任务 上 已 
合 能 力 被 广泛 应 用 于 交通 流 预测 任务 。Yu 等 全 使 用 深度 的 。 ”取得 相对 成 功 ， 但 这 些 模 型 仍然 存在 缺陷 。 首 先 ， 这 些 方 法 
长 短期 记忆 网 络 (LSTM) 来 预测 交通 序列 , 实验 证 明了 基于 神 ，” 仅 采用 预定 义 的 图 邻接 结构 捕获 节点 间 的 空间 依赖 关系 ， 却 
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上 时 序 之 间 的 相关 性 
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在 交通 预测 任务 中 通常 将 每 个 传感器 看 做 一 个 节点 ， 传 


E 离 或 上 下 游 关 系 构成 节点 之 间 的 连 边 ， 则 交通 


效果 。 
z 构建 单独 的 图 ,然后 使 用 
a = 大 量 实验 ， 该 方法 已 被 
献 [20] 专 注 于 一 种 新 颖 的 金融 事件 预测 
z g = 基于 事件 图 来 更 新 事 人 
ae - a 更 好 地 模拟 节点 交互 并 更 好 地 从 图 
a = GGNN 还 被 应 用 于 其 他 任务 ， 如 : 
本 = 识别 24 等 。 对 于 时 空 数据 预测 问题 
性 能 ， 受 此 启发 ， 本 文采 
图 1 问题 描述 点 相关 性 矩阵 来 共同 应 对 长 短期 的 交通 预测 问题 。 
Pa p Fig. 1 Probie description rrr 2 模型 
为 解决 上 述 问题 ， 本 文 提出 了 一 种 新 的 端 到 端的 时 空 数 
据 预 测 模型 ， 即 Ada-GGNN。 首 先 ， 该 模型 通过 空间 传递 模 。 ”2.1 问题 定义 
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IX eR" 表示 输入 的 交通 数据 ，wss ER 表示 模型 参数 和 矩阵 ， 其 中 ， Woe 和 bu 为 全 连接 层 参 数 。 考 虑 到 交通 预测 问题 是 一 
并 采用 ReLU 激活 函数 ， 因 此 该 图 卷 积 层 定义 如 式 (2) 所 示 。 个 回归 任务 ， 所 以 采用 平均 绝对 误差 (MAE) 作 为 损失 函数 ， 


Zik = ReLU (Aygl*WE,),k el[l,2] (2) 


对 于 交通 路 网 中 节点 上 时 间 序 列 的 关联 关系 挖掘 ， 令 
Aw ERS 表示 可 学 习 的 节点 间 自 适应 相关 性 矩阵 , 并 随机 初 
始 化 ， 通 过 模型 的 训练 自动 捕获 和 调整 节点 间 关 联 关系 的 大 
小 。 该 图 卷 积 层 定 义 如 式 (3) 所 示 。 


Zi = ReLU (Aaaa We ) k ell,2] (3) 
值得 注意 的 是 ， 该 模块 对 交通 路 网 中 的 拓扑 关系 进行 了 
二 阶 交 互 (Ke[l,2] ), 因此 , 4k X1, m= =x; sk WIN, 


re =RU (如 图 1 所 示 )。 最后, 将 两 部 分 提取 到 的 信息 通 
过 拼接 的 方式 进行 特征 融合 ， 如 式 (4) 所 示 。 


2° = Zor || Zea kell,2] (4) 
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图 3 空间 传递 模块 结构 
Fig.3 The architecture of the SP module 

2.4 时 空 融合 模块 

空间 传递 模块 捕获 了 每 个 时 间 步 节点 之 间 的 空间 特征 和 
序列 相关 性 ， 并 提取 了 它们 融合 后 的 特征 表达 ， 但 交通 预测 
是 一 个 时 空 预测 任务 ， 不 仅仅 要 捕获 空间 信息 ， 还 需要 捕获 
序列 上 的 时 间 依 赖 性 。 因 此 , 在 时 空 融合 模块 , 通过 GRU f 
获 序列 时 间 维 度 上 的 依赖 性 ， 并 以 循环 聚合 的 方式 在 每 个 时 
间 步 进行 实时 的 时 空 融 合 。 如 公式 (5) 所 示 , GRU 接收 两 个 输 
A 一 个 是 具有 空间 信息 的 当前 时 刻 数据 杠 入 表示 z, 另 
个 是 上 一 状态 表示 Hove 。 由 于 在 每 个 时 间 步 Ada-GGNN 采取 
了 二 阶 的 时 空 交互 (如 图 1 所 示 )， 所 以 在 k 阶 时 的 上 一 状态 
表达 有 所 不 同 ， 具 体 如 公式 (6) 所 示 。 


El. 


HY = GRU (Z*™*, Hore) 6) 
Hyro SHH ,k=1 6 
Ho =H ,k=2 : 


GRU 通过 门 控 机 制 来 控制 当前 时 刻 输 入 和 上 一 状态 的 
写 入 程度 ， 更 新 门 的 值 越 大 ， 重 置 门 的 值 越 小 ， 则 表示 上 一 
状态 的 信息 被 写 入 的 越 少 。 以 这 种 方式 ，Ada-GGNN 能 够 捕 


获 交 通 数 据 长 期 的 时 间 相 关 性 ， 其 详细 操作 如 下 公式 所 示 。 
utk =o(W,[2'*,H,,.]+5,) (7) 
rr* = o (W, [Z**, He] +b,) (8) 
At =tanh(W [Z5 re *H re] +b; ) (9) 
Hek =(1-u®*)*H e Fut eA a0) 
p, use 和 =** 分 别 表示 GRU 中 更 新 门 和 重 置 门 大 小 ，。 


表示 Sigmoid 激活 函数 ， 丈 和 是 可 学 习 参 数 。 
2.5 预测 

经 过 工 个 时 间 步 的 时 空 融合 后 , Ada-GGNN 采用 全 连接 
层 得 到 最 后 的 预测 结果 ， 如 公式 (12) 所 示 。 


Ê = Wy HOP + bo (11) 


其 定义 如 公式 (13) 所 示 。 
3 ”实验 


3.1 数据 集 

为 了 评估 所 提出 模型 的 有 效 性 ， 在 两 个 公开 可 用 的 真实 
交通 数据 集 PeMSD7 和 Los-loop 上 进行 了 实验 。PeMSD7 数 
据 集 是 加 利 福 尼 亚 州 2012 年 5 月 和 6 月 ( 仅 工作 日 , 共 44 天 ) 
的 交通 数据 , 由 228 个 传感器 收集 的 交通 速度 组 成 。Los-loop 
数据 集 是 洛杉矶 高 速 公 路 上 207 个 检测 器 收集 的 2012 年 3 
月 1 日 至 7 日 的 交通 速度 数据 。 在 所 有 实验 中 ， 将 每 间隔 5 
分 钟 汇 总 一 次 的 交通 速度 作为 交通 特征 ， 并 选择 前 80% 的 数 
据 作 为 训练 集 ， 剩 下 的 20% 作 为 测试 集 。 其 数据 集 的 具体 统 
计 信 息 如 表 1 所 示 。 
表 1 两 个 数据 集 的 统计 信息 


mur 


| 


aur 
o 


Tab. 1 Summary statistics of two traffic network datasets 
数据 集 BA iw 时 间 步 长 最 大 值 FHE 
PeMSD7 228 832 12672 82.6 58.9 
Los-loop 207 2833 2016 70.0 58.9 


3.2 ”实验 设置 

在 实验 中 ， 采 用 Python 编程 语言 和 Pytorch 深度 学 习 框 
架 对 模型 进行 实现 ， 将 前 60 分 钟 的 交通 数据 作为 模型 的 输 
入 预测 未 来 15、30、60 分 钟 的 交通 速度 。 训 练 过 程 中 ， 学 习 
率 设置 为 0.001，epoch 设置 为 1000， 采 用 Adam 优化 器 R25]。 
为 防止 模型 过 拟 合 ， 采 用 “ 早 停 法 ”(Early Stopping) 进 行 训 
练 。 所 有 实验 均 在 具有 16GB RAM 的 单个 NVIDIA Tesla T4 
GPU 上 进行 。 
本 文 所 提出 的 模型 与 以 下 七 种 基线 方法 进行 比较 : 
a) ARIMA: 自 回 归 整 合 移动 平均 模型 是 一 种 经 典 的 自 回 
归 模 型 ， 它 将 自 回 归 、 滑 动 平均 以 及 差分 法 结合 在 一 起 对 时 
间 序 列 数据 进行 预测 。 

b) SVRSI; 支持 向 量 回 归 模 型 是 SVM 的 重要 应 
实验 中 采用 线性 核 函 数 进行 交通 预测 任务 。 

c)ASTGCNU], 该 模型 主要 由 三 个 独立 的 组 件 组 成 ， 分 
别 对 小 时 、 天 、 周 的 时 间 属 性 进行 建 模 ， 每 个 组 件 都 包含 了 
时 空 注 意 力 机 制 和 时 空 卷 积 两 个 操作 部 分 ， 并 通过 加 权 融 合 
的 方式 产生 最 终 的 预测 。 

d) 工 GCNI0: 该 模型 通过 GCN 学 习 交 通路 网 的 拓扑 结 
构 ，GRU 来 学 习 交 通 数据 的 动态 变化 ， 从 而 捕获 空间 依赖 性 
和 时 间 依 赖 性 。 
e) A3T-GCN?7!, A3T-GCN 在 工 GCN 的 基础 上 ,引入 了 
注意 力 机 制 来 调整 不 同时 间 点 的 重要 性 并 组 装 全 局 时 间 信 息 
来 进行 交通 预测 。 

站 LSGCNP3: 该 CN 和 图 注意 力 网 络 集成 到 一 
个 空间 门 控 块 中 ， 通 过 空间 门 控 块 和 门 控 线 性 单元 P3(GLU) 
来 捕获 数据 的 时 空 特征 并 得 到 预测 结果 。 
g) GWNB0: 该 模型 通过 一 个 可 学 习 的 方式 来 捕捉 数据 
中 隐藏 的 空间 依赖 ， 同 时 ， 使 用 扩张 一 维 卷 积 组 件 扩大 感受 
野 以 此 来 处 理 长 序列 数据 。 

为 了 验证 Ada-GGNN 的 
来 测试 各 模型 性 能 。 

a) 均 方 根 误差 (RMSE) 


分 支 ， 


2 


部 
He 
at 
Q 


了 效 性 , 采用 以 下 三 个 评价 指标 


RMSE = (12) 
b) 平均 绝对 误差 (MAE) 
1 a 
MAE= 志 2 一 (13) 
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c) 平均 绝对 百分比 误差 (MAPE) 


M 


MIS — 
MAPE = I5 PADA 
il Yi 


x100% (14) 


其 中 : M 表示 样本 数量 , ”表示 第 i 个 样本 的 实际 交通 速度 ， 


六 表示 第 让 个 样本 的 模型 预测 值 。 


3.3 实验 结果 分 析 


表 2 显示 了 Ada-GGNN 和 其 他 基线 模型 在 两 个 数据 集 


Wi 


上 进行 15、30 和 60 分 钟 交 通 预 测 的 比较 结果 ， 从 表 2 中 可 


以 得 到 以 下 观察 结果 : 


基于 神经 网 络 的 方法 在 两 个 数据 集 上 的 所 有 评估 指标 比 
和 专 统 的 时 间 序 列 分 析 方法 和 机 器 学 习 方 法 (如 ARIMA 和 SVR) 
更 低 的 预测 误差 。 这 些 结果 的 原因 是 ARIMA 和 SVR 模 
型 的 非 线 性 建 模 能 力 有 限 。 特 别 是 ARIMA 对 数据 的 稳定 性 


要 求 很 高 ， 但 交通 数据 是 复 
ARIMA 呈现 出 最 不 理想 的 预 


杂 的 ， 且 影响 因素 较 多 ， 所 以 
测 结果 。 相 比 之 下 , 这 些 神经 网 


络 模型 不 仅 擅长 对 非 线性 数据 进行 建 模 ， 还 引入 了 拓扑 结构 
获得 交通 路 网 的 空间 特征 。 因 此 ， 基 于 神经 网 络 的 方法 表现 


出 更 好 的 性 能 。 


Ada-GGNN 在 两 个 数据 集 的 长 期 和 短期 预测 上 实现 了 比 
其 他 基线 模型 更 先进 的 预测 性 能 。 

RER 15 分 钟 交 通 预 测 任务 ，Ada-GGNN 在 RMSE Ett 
GWN 提高 了 2.21%， 比 LSGCN 提高 了 8.10%。 类 似 的 结果 
岂 出 现在 其 他 时 间 跨 度 预 测 任 务 和 评估 指标 的 比较 中 。 这 主 
要 是 Ada-GGNN 模型 的 架构 因素 促进 了 这 些 改进 。 首 先 ， 


例如 ， 对 于 Los-loop 数据 


Ada-GGNN 是 一 次 输出 多 个 时 


步 的 预测 结果 ， 而 LSGCN 


mj 


需要 依靠 先前 的 预测 再 生成 下 一 时 间 步 的 预测 ， 这 样 会 导致 


预测 误差 的 累积 , 所 以 在 长 


的 预测 结果 上 Ada-GGNN 表现 


更 优异 。 此 外 ，Ada-GGNN 采用 可 学 习 的 方式 挖掘 了 交通 路 


网 中 节点 序列 之 间 的 关联 关系 , 使 得 节点 的 嵌入 表达 更 丰富 ， 


为 模型 引入 了 新 的 有 用 信息 ， 


粒度 的 动态 时 空 关 系 。 
3.3.1 隐藏 层 单 元 数目 的 影响 


有 助 于 提高 预测 精度 。 最 后 ， 


所 提出 的 模型 应 用 了 循环 聚合 方法 以 实时 融合 方式 学 习 时 空 
嵌入 ， 而 不 是 单独 的 提取 和 延迟 融合 范式 ， 这 有 助 于 学 习 引 


通常 ， 隐 藏 层 单元 的 数 


是 导致 过 拟 合 的 直接 原因 ， 因 


此 隐藏 层 单元 数目 的 设置 在 模型 调 优 过 程 中 至 关 重 要 。 本 实 


高 斯 噪声 和 


在 何 种 噪声 分 布 中 
GGNN 可 以 适应 噪声 数据 且 
表 2 Ada-GGNN 与 其 


中 方差 cs[0.2,0. 


中 参数 Xes[L2.4.8.16] 。 


经 网 络 的 交通 流 预 测 
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估 指 标 


也 基准 


nF 
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松 噪 声 。 高 斯 噪声 服从 高 斯 分 布 Ysh=0c) , 
4.0.6,0.8,1] ; 泊 松 噪声 服从 泊 松 分 布 ?(4)， 其 
从 图 中 结果 可 以 看 出 ，Ada-GGNN 无 论 

i 的 变化 都 很 微小 。 
J (RGR AS FE 
模型 在 PeMSD7 和 Los-loop 数据 自 
的 性 能 比较 
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Tab. 2 Performance comparison of Ada-GGNN and other baselines on 


pemsd7 and Los-loop datasets 


Datasets Models 


15min 


30min 


60min 


RMSE MAE MAPE 


RMSE MAE MAPE RMSE MAE MAPE 


验 从 [16,32,64,96,128,160] 中 选择 隐藏 单元 数量 ， 并 分 析 不 同 
隐藏 单元 数量 对 模型 预测 精度 的 影响 。 如 图 4 所 示 ， 横 轴 表 
示 隐 藏 单元 的 数量 ， 纵 轴 表 示 不 同 的 度量 指标 。 从 图 中 可 以 


低 再 增加 , 且 当 隐 藏 层 单元 个 
数据 集 的 预测 误差 最 低 。 这 主 


看 出 ， 随 着 隐藏 单元 个 数 的 增加 ，RMSE 和 MAE 指标 先 降 


数 为 96 时 ,Los-loop 和 PeMSD7 
要 是 因为 隐藏 单元 个 数 过 大 时 ， 


模型 复杂 度 较 大 ， 容 易 发 生 过 拟 合 。 
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(b)PeMSD7 数据 集 


集 上 不 同 隐藏 层 单元 个 数 的 影响 


Fig.4 Influence of different hidden units on both datasets 


3.3.2 模型 鲁 棒 性 验证 
在 交通 数据 采集 过 程 中 ， 


棒 性 。 如 图 5 所 示 ， 在 实验 


传感器 难免 会 为 数据 引入 噪声 ， 


ALE, 本 实验 通过 扰动 分 析 实 验 来 测试 Ada-GGNN 的 模型 鲁 


P 添 加 了 两 种 随机 噪声 ， 分 别 是 


ARIMA 12.29 10.12 25.29% 12.30 10.12 25.30% 12.35 10.23 25.42% 
SVR 4.89 4.08 8.28% 5.90 4.66 9.77% 7.43 5.64 12.30% 
ASTGCN 3.41 1.94 4.50% 4.56 2.58 6.11% 6.11 3.31 8.39% 
T-GCN 3.45 1.93 4.41% 4.50 2.52 5.93% 6.08 3.23 8.32% 
PeMSD7 
A3T-GCN 3.40 1.89 4.30% 4.38 2.35 5.68% 5.82 3.39 8.19% 
LSGCN 3.37 1.92 4.33% 4.43 2.33 5.66% 6.17 3.48 8.38% 
GWN 3.39 1.89 4.32% 4.45 2.39 5.62% 5.96 3.15 7.86% 
Ada-GGNN 3.30 1.82 4.21% 4.34 2.32 5.59% 5.46 2.91 7.18% 
ARIMA 10.05 7.71 20.84% 10.06 7.71 20.86% 10.07 7.72 20.90% 
SVR 5.65 3.86 9.33% 6.73 4.65 11.51% 8.03 4.22 14.65% 
ASTGCN 5.25 3.27 8.05% 6.14 3.76 9.68% 7.47 4.43 12.29% 
Los- T-GCN 5.21 3.27 8.34% 6.12 3.81 9.96% 7.27 4.42 12.11% 
loop A3T-GCN 5.12 3.17 8.08% 6.10 3.73 9.98% 7.23 4.56 12.21% 
LSGCN 5.31 3.35 8.33% 6.24 3.82 9.95% 7.63 4.88 12.94% 
GWN 4.99 2.86 7.32% 5.93 3.26 8.81% 7.15 3.98 11.48% 
Ada-GGNN 4.88 2.79 7.16% 5.83 3.18 8.68% 7.07 3.90 10.96% 
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(a) 高 斯 扰动 (b) 泊 松 扰动 
图 5 高 斯 扰动 和 泊 松 扰动 对 Ada-GGNN 在 Los-loop 数据 集 上 的 影响 


Fig.5 The influence of Gaussian perturbation and Poisson 
perturbation on the Ada-GGNN on the Los-loop dataset 
3.3.3 6 3E AK EY OE 


为 了 验证 空间 传递 模块 中 自 


性 , 设计 了 如 


下 对 比 实验 。 其 
的 基础 上 去 除了 自 适 应 时 序 相 关 忻 


邻接 矩阵 来 捕获 交通 路 网 
15 分 钟 和 60 分 钟 预测 任务 上 的 实验 


SNE 


ao 


学 习 


T 


表 3 PRAY 


的 空间 依赖 性 。 在 


+ FA. 
结果 


中 时 序 相关 性 


适应 相关 性 矩阵 学 习 的 有 效 
，No_Ada 模型 在 Ada-GGNN 
操作 ， 仅 采用 预定 义 
个 数据 集 上 的 
如 表 3 所 示 。 


E 学 习 的 影响 


Tab.3 Influence of learning time-series correlation in the SP module 


Datasets Models 


1 


Smin 


60min 


RMSE MAE 


MAPE RMSE MAE MAPE 


No_Ada 


PeMSD7 


Ada-GGNN 


No_Ada 


Los-loop 


Ada-GGNN 


3.59 
3.30 


1.99 
1.82 


5.05 2.86 


4.88 


2.79 


4.62% 
4.21% 


7.28% 


7.16% 


5.99 3.18 7.98% 
5.46 2.91 7.18% 


7.59 4.08 11.55% 


7.07 3.90 10.96% 


从 表 3 4 
务 中 ， 所 提 


No_Ada 模型 


u 


的 实验 结果 可 以 发 现 ， 在 
出 的 Ada-GGNN 模型 的 预测 必 
。 这 主要 是 


PAS BLE 
E 能 明显 优 于 
因为 Ada-GGNN 模型 不 仅 捕 获 了 


RAY AS TF 


道路 网 络 的 空间 关系 ， 还 学 习 到 了 各 节点 间 的 时 序 相关 性 


弥补 了 以 往 3 
一 的 空间 关系 的 缺陷 。 


eT 图 让 


申 经 网 络 的 交通 流 预 测 方法 仅 含有 单 
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同时 ,为 进一步 解释 学 习 到 的 自 适应 相关 性 矩阵 的 作用 ， 
还 进行 了 以 下 实验 ， 即 通过 Los-loop 数据 集 上 部 分 节点 的 地 
理 位置 可 视 化 和 学 习 到 的 节点 序列 间 相 关 性 矩阵 的 热力 图 做 
进一步 探索 。 图 6(a) 是 6 个 节点 的 地 理 位 置 图 ， 图 6(b) 是 经 
过 归 一 化 处 理 后 对 应 的 6 个 节点 序列 之 间 的 相 E 阵 热力 
图 。 首先 ,从 图 6(b) 可 以 明显 看 到 , 2 号 节点 所 在 列 比 其 他 列 
这 表明 2 号 节点 在 预测 时 对 图 中 其 他 节点 更 
影响 ， 该 节点 与 其 他 节点 序列 相关 性 较 高 。 其 次 ， 在 预 
AA ds an 节点 由 于 距离 3、4 号 节点 太 远 ， 
并 不 存在 连接 关系 。 然 而 从 图 6(b) 中 能 够 发 现 ，6 号 节点 对 
3、4 号 节点 有 较 大 影响 且 存 在 关联 关系 。 这 表明 Ada-GGNN 
能 够 通过 自 适 应 相关 性 矩阵 发 现 因 距离 原因 在 预定 义 邻 接 算 


ue 
HF 


U 


阵 中 丢失 的 节点 连接 ， 并 为 模型 引入 新 的 有 用 信息 ， 提 高 模 
型 预测 精度 。 


0.04 


0.02 


Me ` a= Ng i 2 3 4 5 6 000 
(a) 部 分 节点 的 地 理 位 置 可 视 化 ”(b) 节 点 的 自 适应 相关 性 矩阵 热力 图 
图 6 学 习 到 的 自 适 应 相关 性 矩阵 

Fig.6 The learned self-adaptive correlation matrix 

3.3.4 模型 计算 花 销 

表 4 展示 了 Ada-GGNN 和 其 他 基于 神经 网 络 的 基线 模 
型 在 Los-loop 数据 集 上 关于 计算 时 间 花 销 的 比较 。 在 训练 阶 
Be, Ada-GGNN HE ASTGCN 快 1.07 秒 , 比 GWN 快 8.65 $, 
但 是 比 T-GCN, A3T-GCN 和 LSGCN 大 概 慢 2~3 WEH, 这 
主要 是 因为 TGCN 仅 使 用 一 层 图 卷 积 和 一 个 GRU 进行 流量 
预测 ， 而 GWN 却 具 有 复杂 的 模型 结构 ， 它 在 每 个 时 空 层 都 
有 残 差 连接 ， 计 算 量 更 大 。 在 测试 集 上 ，LSGCN 比 其 他 模型 
花费 了 更 多 时 间 ， 这 是 因为 LSGCN 必须 根据 先前 的 预测 来 
生成 之 后 的 预测 结果 ， 而 其 他 模型 都 是 一 次 生成 多 个 时 间 步 
预测 结果 。 因 此 考虑 模型 的 预测 精度 和 时 间 花 销 ， 所 提出 的 
Ada-GGNN 仍然 具有 很 强 的 综合 表现 。 

表 4 Los-loop 数据 集 上 的 计算 时 间 


Tab.4 Computation time on the Los-loop dataset 


Computation Time 


Models 
Training (s/epoch) Testing (s) 
ASTGCN 5.59 0.44 
T-GCN 0.95 0.11 
A3T-GCN 1.05 0.11 
LSGCN 1.95 1.83 
GWN 13.17 0.60 
Ada-GGNN 4.52 0.41 
4 ”结束 语 
本 文 针 对 交通 流 预测 问题 提出 了 一 种 新 的 端 到 端的 自 适 
应 门 控 图 神经 网 络 (Ada-GGNN) 模 型 。 该 模型 利用 可 学 习 的 
自 适 应 矩阵 从 数据 中 获取 节点 间 的 序列 相关 性 ， 为 模型 引入 
了 新 的 有 用 信息 ， 并 基于 门 控 图 神经 网 络 来 处 理 长 期 的 预测 


问题 。 在 两 个 公共 交通 数据 集 上 ，Ada-GGNN 取得 了 最 优异 
的 结果 。 考 虑 到 实际 的 交通 预测 问题 受到 许多 外 部 因素 的 影 
W, 例如 天 气 、 温度 、 社 会 事件 等 , 因此 , 在 未 来 的 工作 中 ， 
将 引入 更 多 的 额外 因素 作为 特征 , 并 探索 在 大 图 上 应 用 Ada- 
GGNN 的 可 扩展 方法 。 


适应 门 控 图 神经 网 络 的 交通 流 预测 


ChinaXiv 合 作 期 刊 
第 39 BF 8 期 


参考 文献 : 


[1] 刘 静 ， 关 伟 . 交通 流 预测 方法 综述 [J] 公路 交通 科技 , 2004, 21 (3): 
82-85. (Liu Jing, Guan Wei. A summary of traffic flow forecasting 
methods [J]. Journal of Highway and Transportation Research and 
Development, 2004, 21 (3): 82-85.) 

[2] Williams B M, Hoel LA. Modeling and forecasting vehicular traffic flow 
as a seasonal ARIMA process: theoretical basis and empirical results [J]. 
Journal of Transportation Engineering, 2003, 129 (6): 664-672. 

[3] Zivot E, Wang Jiahui. Vector autoregressive models for multivariate time 
series [M]// Modeling Financial Time Series with S-Plus®. New York, 
NY, USA: Springer, 2003: 369-413. 

[4] 张 晓 利 , HAX, HŽ. 基于 K- 邻 域 非 参数 回归 短 时 交通 流 预测 
方法 [J] 系统 工程 学 报 , 2009, 24 (2): 178-183. (Zhang Xiaoli, He 
Guoguang, Lu Huapu. Short-term traffic flow forecasting based on K- 
nearest neighbors non-parametric regression [J]. Journal of Systems 
Engineering, 2009, 24 (2): 178 - 183.) 

[5] Yu R, Li Yaguang, Shahabi C, et al. Deep learning: a generic approach 
for extreme condition traffic forecasting [C]// Proc of SIAM International 
Conference on Data Mining. 2017: 777-785. 

[6] Shi Xingjian, Chen Zhourong, Wang Hao, et al. Convolutional LSTM 
network: a machine learning approach for precipitation nowcasting [C]// 
Proc of the 28th International Conference on Neural Information 
Processing Systems. Cambridge, MA: MIT Press, 2015: 802—810. 

[7] Zhang Junbo, Zheng Yu, Qi Dekang. Deep spatio-temporal residual 
networks for citywide crowd flows prediction [C]// Proc of the 31st 
AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 
2017: 1655-1661. 

[8] Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent 
neural network: data-driven traffic forecasting [C/OL]/ Proc of the 6th 
International Conference on Learning Representations. [S. 1. ] 
OpenReview. net, 2018. (2018) [2022-01-12]. https://openreview. 
net/forum?id=SJiHXGWAZ. 

[9] Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph 
convolutional networks: a deep learning framework for traffic 
forecasting [C]// Proc of the 27th International Joint Conference on 
Artificial Intelligence. California: IJCAI, 2018: 3634-3640. 

[10] Guo Shengnan, Lin Youfang, Feng Ning, et a/. Attention based spatial- 
temporal graph convolutional networks for traffic flow forecasting [C]// 
Proc of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, 
CA: AAAI Press, 2019: 922-929. 

[11] Zhao Ling, Song Yujiao, Zhang Chao, et al. T-GCN: a temporal graph 
convolutional network for traffic prediction [J]. IEEE Trans on 
Intelligent Transportation Systems, 2020, 21 (9): 3848-3858. 

[12] Cho K, Van Merrienboer B, Gulcehre C, ef al. Learning phrase 
representations using RNN encoder-decoder for statistical machine 
translation [C]// Proc of EMNLP. Stroudsburg, PA: ACL, 2014: 1724-1734. 

[13] Gori M, Monfardini G, Scarselli F. A new model for learning in graph 
domains [C]// Proc of IEEE IJCNN. Piscataway, NJ: IEEE Press, 2005: 729-734. 

[14] Defferrard M, Bresson X, Vandergheynst P. Convolutional neural 
networks on graphs with fast localized spectral filtering [C]// Proc of the 
30th International Conference on Neural Information Processing 
Systems. Red Hook, NY: Curran Associates Inc, 2016: 3837-3845. 

[15] Kipf T N, Welling M. Semi-supervised classification with graph 
convolutional networks [C/OL]/ Proc of the 5th International Conference 
on Learning Representations. [S. 1. ] : OpenReview. net, 2017. [2022-01- 
12]. https://openreview. net/forum?id=SJU4ayY gl. 


[16] Hamilton W L, Ying R, Leskovec J. Inductive representation learning on 


large graphs [C]// Proc of the 31st International Conference on Neural 
Information Processing Systems. Red Hook, NY: Curran Associates Inc, 
2017: 1025-1035. 

[17] Velickovic P, Cucurull G, Casanova A, el al. Graph attention networks 
[C/OL) Proc of the 6th International Conference on Learning 
Representations. [S. 1. ] : OpenReview. net, 2018. (2018) [2022-01-12]. 
https://openreview. net/forum?id=rJ XMpikCZ. 

[18] Li Yujia, Zemel R, Brockschmidt M, et al. Gated graph sequence neural 


networks [C/OL]/ Proc of the 4th International Conference on Learning 


Representations. 2016. (2016) [2022-01-12]. http://arxiv. org/abs/1511.05493. 


[19] Zhang Yufeng, Yu Xueli, Cui Zeyu, et al. Every document owns its 
structure: inductive text classification via graph neural networks [C]// 
Proc of the 58th Annual Meeting of the Association for Computational 
Linguistics. Stroudsburg, PA: ACL, 2020: 334-339. 

[20] Yang Yiying, Wei Zhongyu, Chen Qin, ef al. Using external knowledge 
for financial event prediction based on graph neural networks [C]// Proc 
of the 28th ACM International Conference on Information and 
Knowledge Management. New York, NY, USA: ACM Press, 2019: 
2161-2164. 

[21] Cui Zeyu, Li Zekun, Wu Shu, et al. Dressing as a whole: outfit 
compatibility learning based on node-wise graph neural networks [C]// 
Proc of WWW Conference. New York, NY, USA: ACM Press, 2019: 
307-317. 

[22] Wu Shu, Tang Yuyuan, Zhu Yanqiao, et al. Session-based 
recommendation with graph neural networks [C]// Proc of the 33rd AAAI 
Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 


王 杨 ， 等 : 基于 自 适应 门 控 图 神经 网 络 的 交通 流 预测 


346-353. 

[23] Marino K, Salakhutdinov R, Gupta A. The more you know: using 
knowledge graphs for image classification [C]// Proc of IEEE CVPR. Los 
Alamitos, CA: IEEE Computer Society, 2017: 20-28. 

[24] Li Ruiyu, Tapaswi M, Liao Renjie, et al. Situation recognition with graph 
neural networks [C]// Proc of IEEE ICCV. Los Alamitos, CA, USA: IEEE 
Computer Society, 2017: 4183-4192. 

[25] Kingma D P, Ba J. Adam: a method for stochastic optimization [C/OL]/ 
Proc of the 3rd International Conference on Learning Representations. 
2015. (2015) [2022-01-12]. http://arxiv. org/abs/1412. 6980. 

[26] Smola A J, Schélkopf B. A tutorial on support vector regression [J]. 
Statistics and Computing, 2004, 14 (3): 199-222. 

[27] Bai Jiandong, Zhu Jiawei, Song Yujiao, et al. A3T-GCN: attention 
temporal graph convolutional network for traffic forecasting [J]. ISPRS 
International Journal of Geo-Information, 2021, 10 (7): 485. 

[28] Huang Rongzhou, Huang Chuyin, Liu Yubao, et al. LSGCN: long short- 
term traffic prediction with graph convolutional networks [C]// Proc of 
the 29th International Joint Conference on Artificial Intelligence. 
California: IJCAI, 2020: 2355-2361. 

[29] Dauphin Y N, Fan A, Auli M, et al. Language modeling with gated 
convolutional networks [C]// Proc of the 34th International Conference 
on Machine Learning. [S. 1. ] : PMLR, 2017: 933-941. 

[30] Wu Zonghan, Pan Shirui, Long Guodong, et al. Graph WaveNet for deep 
spatial-temporal graph modeling [C]// Proc of the 28th International Joint 
Conference on Artificial Intelligence. California: IJCAI, 2019: 1907- 
1913. 


